home *** CD-ROM | disk | FTP | other *** search
/ Celestin Apprentice 5 / Apprentice-Release5.iso / Source Code / C / Applications / Python 1.3.3 / Python 133 68K / Lib / profile.py < prev    next >
Text File  |  1996-05-20  |  20KB  |  616 lines

  1. #
  2. # Class for profiling python code. rev 1.0  6/2/94
  3. #
  4. # Based on prior profile module by Sjoerd Mullender...
  5. #   which was hacked somewhat by: Guido van Rossum
  6. #
  7. # See profile.doc for more information
  8.  
  9.  
  10. # Copyright 1994, by InfoSeek Corporation, all rights reserved.
  11. # Written by James Roskind
  12. # Permission to use, copy, modify, and distribute this Python software
  13. # and its associated documentation for any purpose (subject to the
  14. # restriction in the following sentence) without fee is hereby granted,
  15. # provided that the above copyright notice appears in all copies, and
  16. # that both that copyright notice and this permission notice appear in
  17. # supporting documentation, and that the name of InfoSeek not be used in
  18. # advertising or publicity pertaining to distribution of the software
  19. # without specific, written prior permission.  This permission is
  20. # explicitly restricted to the copying and modification of the software
  21. # to remain in Python, compiled Python, or other languages (such as C)
  22. # wherein the modified or derived code is exclusively imported into a
  23. # Python module.
  24. # INFOSEEK CORPORATION DISCLAIMS ALL WARRANTIES WITH REGARD TO THIS
  25. # SOFTWARE, INCLUDING ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND
  26. # FITNESS. IN NO EVENT SHALL INFOSEEK CORPORATION BE LIABLE FOR ANY
  27. # SPECIAL, INDIRECT OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES WHATSOEVER
  28. # RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF
  29. # CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN
  30. # CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  31.  
  32.  
  33.  
  34. import sys
  35. import os
  36. import time
  37. import string
  38. import marshal
  39.  
  40.  
  41. # Global variables
  42. func_norm_dict = {}
  43. func_norm_counter = 0
  44. if hasattr(os, 'getpid'):
  45.     pid_string = `os.getpid()`
  46. else:
  47.     pid_string = ''
  48.  
  49.  
  50. # Sample timer for use with 
  51. #i_count = 0
  52. #def integer_timer():
  53. #    global i_count
  54. #    i_count = i_count + 1
  55. #    return i_count
  56. #itimes = integer_timer # replace with C coded timer returning integers
  57.  
  58. #**************************************************************************
  59. # The following are the static member functions for the profiler class
  60. # Note that an instance of Profile() is *not* needed to call them.
  61. #**************************************************************************
  62.  
  63.  
  64. # simplified user interface
  65. def run(statement, *args):
  66.     prof = Profile()
  67.     try:
  68.         prof = prof.run(statement)
  69.     except SystemExit:
  70.         pass
  71.     if args:
  72.         prof.dump_stats(args[0])
  73.     else:
  74.         return prof.print_stats()
  75.  
  76. # print help
  77. def help():
  78.     for dirname in sys.path:
  79.         fullname = os.path.join(dirname, 'profile.doc')
  80.         if os.path.exists(fullname):
  81.             sts = os.system('${PAGER-more} '+fullname)
  82.             if sts: print '*** Pager exit status:', sts
  83.             break
  84.     else:
  85.         print 'Sorry, can\'t find the help file "profile.doc"',
  86.         print 'along the Python search path'
  87.  
  88.  
  89. #**************************************************************************
  90. # class Profile documentation:
  91. #**************************************************************************
  92. # self.cur is always a tuple.  Each such tuple corresponds to a stack
  93. # frame that is currently active (self.cur[-2]).  The following are the
  94. # definitions of its members.  We use this external "parallel stack" to
  95. # avoid contaminating the program that we are profiling. (old profiler
  96. # used to write into the frames local dictionary!!) Derived classes
  97. # can change the definition of some entries, as long as they leave
  98. # [-2:] intact.
  99. #
  100. # [ 0] = Time that needs to be charged to the parent frame's function.  It is
  101. #        used so that a function call will not have to access the timing data
  102. #        for the parents frame.
  103. # [ 1] = Total time spent in this frame's function, excluding time in
  104. #        subfunctions
  105. # [ 2] = Cumulative time spent in this frame's function, including time in
  106. #        all subfunctions to this frame.
  107. # [-3] = Name of the function that corresonds to this frame.  
  108. # [-2] = Actual frame that we correspond to (used to sync exception handling)
  109. # [-1] = Our parent 6-tuple (corresonds to frame.f_back)
  110. #**************************************************************************
  111. # Timing data for each function is stored as a 5-tuple in the dictionary
  112. # self.timings[].  The index is always the name stored in self.cur[4].
  113. # The following are the definitions of the members:
  114. #
  115. # [0] = The number of times this function was called, not counting direct
  116. #       or indirect recursion,
  117. # [1] = Number of times this function appears on the stack, minus one
  118. # [2] = Total time spent internal to this function
  119. # [3] = Cumulative time that this function was present on the stack.  In
  120. #       non-recursive functions, this is the total execution time from start
  121. #       to finish of each invocation of a function, including time spent in
  122. #       all subfunctions.
  123. # [5] = A dictionary indicating for each function name, the number of times
  124. #       it was called by us.
  125. #**************************************************************************
  126. # We produce function names via a repr() call on the f_code object during
  127. # profiling. This save a *lot* of CPU time.  This results in a string that
  128. # always looks like:
  129. #   <code object main at 87090, file "/a/lib/python-local/myfib.py", line 76>
  130. # After we "normalize it, it is a tuple of filename, line, function-name.
  131. # We wait till we are done profiling to do the normalization.
  132. # *IF* this repr format changes, then only the normalization routine should
  133. # need to be fixed.
  134. #**************************************************************************
  135. class Profile:
  136.  
  137.     def __init__(self, timer=None):
  138.         self.timings = {}
  139.         self.cur = None
  140.         self.cmd = ""
  141.  
  142.         self.dispatch = {  \
  143.               'call'     : self.trace_dispatch_call, \
  144.               'return'   : self.trace_dispatch_return, \
  145.               'exception': self.trace_dispatch_exception, \
  146.               }
  147.  
  148.         if not timer:
  149.             if hasattr(os, 'times'):
  150.                 self.timer = os.times
  151.                 self.dispatcher = self.trace_dispatch
  152.             else:
  153.                 self.timer = time.time
  154.                 self.dispatcher = self.trace_dispatch_i
  155.         else:
  156.             self.timer = timer
  157.             t = self.timer() # test out timer function
  158.             try:
  159.                 if len(t) == 2:
  160.                     self.dispatcher = self.trace_dispatch
  161.                 else:
  162.                     self.dispatcher = self.trace_dispatch_l
  163.             except TypeError:
  164.                 self.dispatcher = self.trace_dispatch_i
  165.         self.t = self.get_time()
  166.         self.simulate_call('profiler')
  167.  
  168.  
  169.     def get_time(self): # slow simulation of method to acquire time
  170.         t = self.timer()
  171.         if type(t) == type(()) or type(t) == type([]):
  172.             t = reduce(lambda x,y: x+y, t, 0)
  173.         return t
  174.         
  175.  
  176.     # Heavily optimized dispatch routine for os.times() timer
  177.  
  178.     def trace_dispatch(self, frame, event, arg):
  179.         t = self.timer()
  180.         t = t[0] + t[1] - self.t        # No Calibration constant
  181.         # t = t[0] + t[1] - self.t - .00053 # Calibration constant
  182.  
  183.         if self.dispatch[event](frame,t):
  184.             t = self.timer()
  185.             self.t = t[0] + t[1]
  186.         else:
  187.             r = self.timer()
  188.             self.t = r[0] + r[1] - t # put back unrecorded delta
  189.         return
  190.  
  191.  
  192.  
  193.     # Dispatch routine for best timer program (return = scalar integer)
  194.  
  195.     def trace_dispatch_i(self, frame, event, arg):
  196.         t = self.timer() - self.t # - 1 # Integer calibration constant
  197.         if self.dispatch[event](frame,t):
  198.             self.t = self.timer()
  199.         else:
  200.             self.t = self.timer() - t  # put back unrecorded delta
  201.         return
  202.  
  203.  
  204.     # SLOW generic dispatch rountine for timer returning lists of numbers
  205.  
  206.     def trace_dispatch_l(self, frame, event, arg):
  207.         t = self.get_time() - self.t
  208.  
  209.         if self.dispatch[event](frame,t):
  210.             self.t = self.get_time()
  211.         else:
  212.             self.t = self.get_time()-t # put back unrecorded delta
  213.         return
  214.  
  215.  
  216.     def trace_dispatch_exception(self, frame, t):
  217.         rt, rtt, rct, rfn, rframe, rcur = self.cur
  218.         if (not rframe is frame) and rcur:
  219.             return self.trace_dispatch_return(rframe, t)
  220.         return 0
  221.  
  222.  
  223.     def trace_dispatch_call(self, frame, t):
  224.         fn = `frame.f_code` 
  225.  
  226.         # The following should be about the best approach, but
  227.         # we would need a function that maps from id() back to
  228.         # the actual code object.  
  229.         #     fn = id(frame.f_code)
  230.         # Note we would really use our own function, which would
  231.         # return the code address, *and* bump the ref count.  We
  232.         # would then fix up the normalize function to do the
  233.         # actualy repr(fn) call.
  234.  
  235.         # The following is an interesting alternative
  236.         # It doesn't do as good a job, and it doesn't run as
  237.         # fast 'cause repr() is written in C, and this is Python.
  238.         #fcode = frame.f_code
  239.         #code = fcode.co_code
  240.         #if ord(code[0]) == 127: #  == SET_LINENO
  241.         #    # see "opcode.h" in the Python source
  242.         #    fn = (fcode.co_filename, ord(code[1]) | \
  243.         #          ord(code[2]) << 8, fcode.co_name)
  244.         #else:
  245.         #    fn = (fcode.co_filename, 0, fcode.co_name)
  246.  
  247.         self.cur = (t, 0, 0, fn, frame, self.cur)
  248.         if self.timings.has_key(fn):
  249.             cc, ns, tt, ct, callers = self.timings[fn]
  250.             self.timings[fn] = cc, ns + 1, tt, ct, callers
  251.         else:
  252.             self.timings[fn] = 0, 0, 0, 0, {}
  253.         return 1
  254.  
  255.     def trace_dispatch_return(self, frame, t):
  256.         # if not frame is self.cur[-2]: raise "Bad return", self.cur[3]
  257.  
  258.         # Prefix "r" means part of the Returning or exiting frame
  259.         # Prefix "p" means part of the Previous or older frame
  260.  
  261.         rt, rtt, rct, rfn, frame, rcur = self.cur
  262.         rtt = rtt + t
  263.         sft = rtt + rct
  264.  
  265.         pt, ptt, pct, pfn, pframe, pcur = rcur
  266.         self.cur = pt, ptt+rt, pct+sft, pfn, pframe, pcur
  267.  
  268.         cc, ns, tt, ct, callers = self.timings[rfn]
  269.         if not ns:
  270.             ct = ct + sft
  271.             cc = cc + 1
  272.         if callers.has_key(pfn):
  273.             callers[pfn] = callers[pfn] + 1  # hack: gather more
  274.             # stats such as the amount of time added to ct courtesy
  275.             # of this specific call, and the contribution to cc
  276.             # courtesy of this call.
  277.         else:
  278.             callers[pfn] = 1
  279.         self.timings[rfn] = cc, ns - 1, tt+rtt, ct, callers
  280.  
  281.         return 1
  282.  
  283.     # The next few function play with self.cmd. By carefully preloading
  284.     # our paralell stack, we can force the profiled result to include
  285.     # an arbitrary string as the name of the calling function.
  286.     # We use self.cmd as that string, and the resulting stats look
  287.     # very nice :-).
  288.  
  289.     def set_cmd(self, cmd):
  290.         if self.cur[-1]: return   # already set
  291.         self.cmd = cmd
  292.         self.simulate_call(cmd)
  293.  
  294.     class fake_code:
  295.         def __init__(self, filename, line, name):
  296.             self.co_filename = filename
  297.             self.co_line = line
  298.             self.co_name = name
  299.             self.co_code = '\0'  # anything but 127
  300.  
  301.         def __repr__(self):
  302.             return (self.co_filename, self.co_line, self.co_name)
  303.  
  304.     class fake_frame:
  305.         def __init__(self, code, prior):
  306.             self.f_code = code
  307.             self.f_back = prior
  308.             
  309.     def simulate_call(self, name):
  310.         code = self.fake_code('profile', 0, name)
  311.         if self.cur:
  312.             pframe = self.cur[-2]
  313.         else:
  314.             pframe = None
  315.         frame = self.fake_frame(code, pframe)
  316.         a = self.dispatch['call'](frame, 0)
  317.         return
  318.  
  319.     # collect stats from pending stack, including getting final
  320.     # timings for self.cmd frame.
  321.     
  322.     def simulate_cmd_complete(self):   
  323.         t = self.get_time() - self.t
  324.         while self.cur[-1]:
  325.             # We *can* cause assertion errors here if
  326.             # dispatch_trace_return checks for a frame match!
  327.             a = self.dispatch['return'](self.cur[-2], t)
  328.             t = 0
  329.         self.t = self.get_time() - t
  330.  
  331.     
  332.     def print_stats(self):
  333.         import pstats
  334.         pstats.Stats(self).strip_dirs().sort_stats(-1). \
  335.               print_stats()
  336.  
  337.     def dump_stats(self, file):
  338.         f = open(file, 'w')
  339.         self.create_stats()
  340.         marshal.dump(self.stats, f)
  341.         f.close()
  342.  
  343.     def create_stats(self):
  344.         self.simulate_cmd_complete()
  345.         self.snapshot_stats()
  346.  
  347.     def snapshot_stats(self):
  348.         self.stats = {}
  349.         for func in self.timings.keys():
  350.             cc, ns, tt, ct, callers = self.timings[func]
  351.             nor_func = self.func_normalize(func)
  352.             nor_callers = {}
  353.             nc = 0
  354.             for func_caller in callers.keys():
  355.                 nor_callers[self.func_normalize(func_caller)]=\
  356.                       callers[func_caller]
  357.                 nc = nc + callers[func_caller]
  358.             self.stats[nor_func] = cc, nc, tt, ct, nor_callers
  359.  
  360.  
  361.     # Override the following function if you can figure out
  362.     # a better name for the binary f_code entries.  I just normalize
  363.     # them sequentially in a dictionary.  It would be nice if we could
  364.     # *really* see the name of the underlying C code :-).  Sometimes
  365.     #  you can figure out what-is-what by looking at caller and callee
  366.     # lists (and knowing what your python code does).
  367.     
  368.     def func_normalize(self, func_name):
  369.         global func_norm_dict
  370.         global func_norm_counter
  371.         global func_sequence_num
  372.  
  373.         if func_norm_dict.has_key(func_name):
  374.             return func_norm_dict[func_name]
  375.         if type(func_name) == type(""):
  376.             long_name = string.split(func_name)
  377.             file_name = long_name[-3][1:-2]
  378.             func = long_name[2]
  379.             lineno = long_name[-1][:-1]
  380.             if '?' == func:   # Until I find out how to may 'em...
  381.                 file_name = 'python'
  382.                 func_norm_counter = func_norm_counter + 1
  383.                 func = pid_string + ".C." + `func_norm_counter`
  384.             result =  file_name ,  string.atoi(lineno) , func
  385.         else:
  386.             result = func_name
  387.         func_norm_dict[func_name] = result
  388.         return result
  389.  
  390.  
  391.     # The following two methods can be called by clients to use
  392.     # a profiler to profile a statement, given as a string.
  393.     
  394.     def run(self, cmd):
  395.         import __main__
  396.         dict = __main__.__dict__
  397.         self.runctx(cmd, dict, dict)
  398.         return self
  399.     
  400.     def runctx(self, cmd, globals, locals):
  401.         self.set_cmd(cmd)
  402.         sys.setprofile(self.dispatcher)
  403.         try:
  404.             exec cmd in globals, locals
  405.         finally:
  406.             sys.setprofile(None)
  407.  
  408.     # This method is more useful to profile a single function call.
  409.     def runcall(self, func, *args):
  410.         self.set_cmd(`func`)
  411.         sys.setprofile(self.dispatcher)
  412.         try:
  413.             apply(func, args)
  414.         finally:
  415.             sys.setprofile(None)
  416.         return self
  417.  
  418.  
  419.         #******************************************************************
  420.     # The following calculates the overhead for using a profiler.  The
  421.     # problem is that it takes a fair amount of time for the profiler
  422.     # to stop the stopwatch (from the time it recieves an event).
  423.     # Similarly, there is a delay from the time that the profiler
  424.     # re-starts the stopwatch before the user's code really gets to
  425.     # continue.  The following code tries to measure the difference on
  426.     # a per-event basis. The result can the be placed in the
  427.     # Profile.dispatch_event() routine for the given platform.  Note
  428.     # that this difference is only significant if there are a lot of
  429.     # events, and relatively little user code per event.  For example,
  430.     # code with small functions will typically benefit from having the
  431.     # profiler calibrated for the current platform.  This *could* be
  432.     # done on the fly during init() time, but it is not worth the
  433.     # effort.  Also note that if too large a value specified, then
  434.     # execution time on some functions will actually appear as a
  435.     # negative number.  It is *normal* for some functions (with very
  436.     # low call counts) to have such negative stats, even if the
  437.     # calibration figure is "correct." 
  438.     #
  439.     # One alternative to profile-time calibration adjustments (i.e.,
  440.     # adding in the magic little delta during each event) is to track
  441.     # more carefully the number of events (and cumulatively, the number
  442.     # of events during sub functions) that are seen.  If this were
  443.     # done, then the arithmetic could be done after the fact (i.e., at
  444.     # display time).  Currintly, we track only call/return events.
  445.     # These values can be deduced by examining the callees and callers
  446.     # vectors for each functions.  Hence we *can* almost correct the
  447.     # internal time figure at print time (note that we currently don't
  448.     # track exception event processing counts).  Unfortunately, there
  449.     # is currently no similar information for cumulative sub-function
  450.     # time.  It would not be hard to "get all this info" at profiler
  451.     # time.  Specifically, we would have to extend the tuples to keep
  452.     # counts of this in each frame, and then extend the defs of timing
  453.     # tuples to include the significant two figures. I'm a bit fearful
  454.     # that this additional feature will slow the heavily optimized
  455.     # event/time ratio (i.e., the profiler would run slower, fur a very
  456.     # low "value added" feature.) 
  457.     #
  458.     # Plugging in the calibration constant doesn't slow down the
  459.     # profiler very much, and the accuracy goes way up.
  460.     #**************************************************************
  461.     
  462.         def calibrate(self, m):
  463.         n = m
  464.         s = self.timer()
  465.         while n:
  466.             self.simple()
  467.             n = n - 1
  468.         f = self.timer()
  469.         my_simple = f[0]+f[1]-s[0]-s[1]
  470.         #print "Simple =", my_simple,
  471.  
  472.         n = m
  473.         s = self.timer()
  474.         while n:
  475.             self.instrumented()
  476.             n = n - 1
  477.         f = self.timer()
  478.         my_inst = f[0]+f[1]-s[0]-s[1]
  479.         # print "Instrumented =", my_inst
  480.         avg_cost = (my_inst - my_simple)/m
  481.         #print "Delta/call =", avg_cost, "(profiler fixup constant)"
  482.         return avg_cost
  483.  
  484.     # simulate a program with no profiler activity
  485.         def simple(self):      
  486.         a = 1
  487.         pass
  488.  
  489.     # simulate a program with call/return event processing
  490.         def instrumented(self):
  491.         a = 1
  492.         self.profiler_simulation(a, a, a)
  493.  
  494.     # simulate an event processing activity (from user's perspective)
  495.     def profiler_simulation(self, x, y, z):  
  496.         t = self.timer()
  497.         t = t[0] + t[1]
  498.         self.ut = t
  499.  
  500.  
  501.  
  502. #****************************************************************************
  503. # OldProfile class documentation
  504. #****************************************************************************
  505. #
  506. # The following derived profiler simulates the old style profile, providing
  507. # errant results on recursive functions. The reason for the usefulnes of this
  508. # profiler is that it runs faster (i.e., less overhead).  It still creates
  509. # all the caller stats, and is quite useful when there is *no* recursion
  510. # in the user's code.
  511. #
  512. # This code also shows how easy it is to create a modified profiler.
  513. #****************************************************************************
  514. class OldProfile(Profile):
  515.     def trace_dispatch_exception(self, frame, t):
  516.         rt, rtt, rct, rfn, rframe, rcur = self.cur
  517.         if rcur and not rframe is frame:
  518.             return self.trace_dispatch_return(rframe, t)
  519.         return 0
  520.  
  521.     def trace_dispatch_call(self, frame, t):
  522.         fn = `frame.f_code`
  523.         
  524.         self.cur = (t, 0, 0, fn, frame, self.cur)
  525.         if self.timings.has_key(fn):
  526.             tt, ct, callers = self.timings[fn]
  527.             self.timings[fn] = tt, ct, callers
  528.         else:
  529.             self.timings[fn] = 0, 0, {}
  530.         return 1
  531.  
  532.     def trace_dispatch_return(self, frame, t):
  533.         rt, rtt, rct, rfn, frame, rcur = self.cur
  534.         rtt = rtt + t
  535.         sft = rtt + rct
  536.  
  537.         pt, ptt, pct, pfn, pframe, pcur = rcur
  538.         self.cur = pt, ptt+rt, pct+sft, pfn, pframe, pcur
  539.  
  540.         tt, ct, callers = self.timings[rfn]
  541.         if callers.has_key(pfn):
  542.             callers[pfn] = callers[pfn] + 1
  543.         else:
  544.             callers[pfn] = 1
  545.         self.timings[rfn] = tt+rtt, ct + sft, callers
  546.  
  547.         return 1
  548.  
  549.  
  550.     def snapshot_stats(self):
  551.         self.stats = {}
  552.         for func in self.timings.keys():
  553.             tt, ct, callers = self.timings[func]
  554.             nor_func = self.func_normalize(func)
  555.             nor_callers = {}
  556.             nc = 0
  557.             for func_caller in callers.keys():
  558.                 nor_callers[self.func_normalize(func_caller)]=\
  559.                       callers[func_caller]
  560.                 nc = nc + callers[func_caller]
  561.             self.stats[nor_func] = nc, nc, tt, ct, nor_callers
  562.  
  563.         
  564.  
  565. #****************************************************************************
  566. # HotProfile class documentation
  567. #****************************************************************************
  568. #
  569. # This profiler is the fastest derived profile example.  It does not
  570. # calculate caller-callee relationships, and does not calculate cumulative
  571. # time under a function.  It only calculates time spent in a function, so
  572. # it runs very quickly (re: very low overhead)
  573. #****************************************************************************
  574. class HotProfile(Profile):
  575.     def trace_dispatch_exception(self, frame, t):
  576.         rt, rtt, rfn, rframe, rcur = self.cur
  577.         if rcur and not rframe is frame:
  578.             return self.trace_dispatch_return(rframe, t)
  579.         return 0
  580.  
  581.     def trace_dispatch_call(self, frame, t):
  582.         self.cur = (t, 0, frame, self.cur)
  583.         return 1
  584.  
  585.     def trace_dispatch_return(self, frame, t):
  586.         rt, rtt, frame, rcur = self.cur
  587.  
  588.         rfn = `frame.f_code`
  589.  
  590.         pt, ptt, pframe, pcur = rcur
  591.         self.cur = pt, ptt+rt, pframe, pcur
  592.  
  593.         if self.timings.has_key(rfn):
  594.             nc, tt = self.timings[rfn]
  595.             self.timings[rfn] = nc + 1, rt + rtt + tt
  596.         else:
  597.             self.timings[rfn] =      1, rt + rtt
  598.  
  599.         return 1
  600.  
  601.  
  602.     def snapshot_stats(self):
  603.         self.stats = {}
  604.         for func in self.timings.keys():
  605.             nc, tt = self.timings[func]
  606.             nor_func = self.func_normalize(func)
  607.             self.stats[nor_func] = nc, nc, tt, 0, {}
  608.  
  609.         
  610.  
  611. #****************************************************************************
  612. def Stats(*args):
  613.     print 'Report generating functions are in the "pstats" module\a'
  614.